AI产业链地图·知识库 NVIDIA H200 · 概念

🚧 网站建设中更新 2026·06·17 登录 / 注册 → 产业链图谱

首页/概念/NVIDIA H200

更新 2026·06·17

概念技术 / 术语

NVIDIA H200

H200 · Hopper H200 · H200 SXM

H200 不是新架构，而是显存升级版 H100 —— 对训练性能提升有限（同等算力），但对推理大模型和长上下文应用至关重要：

NVIDIA H200 CONCEPT · 概念

首次提出: 2023
关键参与方: [[NVIDIA]] · [[CoreWeave]] · [[Microsoft Azure]]
反向引用: 16 处 · 来自 7 页

归属 GPUAI芯片NVIDIA数据中心Hopper第二层

NVIDIA H200

NVIDIA Hopper 架构升级版数据中心 GPU（2023-11 发布，2024-Q2 出货），算力与 NVIDIA H100 同代，但显存升级至 141GB HBM3E、带宽提升至 4.8 TB/s，专为大模型推理和长上下文场景优化，承接 H100 → NVIDIA B200 之间的过渡市场。

关键规格

维度	数值
架构	Hopper（与 H100 同核）
发布	2023-11（SC23）/ 2024-Q2 量产
制程	TSMC 4N
显存	141 GB HBM3E（vs H100 的 80GB HBM3）
显存带宽	4.8 TB/s（vs H100 的 3.35 TB/s）
FP16 / BF16	~989 TFLOPS（与 H100 一致）
FP8	~1,979 TFLOPS
TDP	700W（SXM5）
互联	NVLink 4（900 GB/s）+ PCIe Gen5
整机形态	HGX H200 8 卡 / DGX H200

市场定位

H200 不是新架构，而是显存升级版 H100 —— 对训练性能提升有限（同等算力），但对推理大模型和长上下文应用至关重要：

70B+ 模型推理单卡可装，无需切分到多卡（vs H100 需 2 卡）
KV cache 容量翻倍，长 context（128K+）推理吞吐显著提升
显存带宽提升 43% → 内存带宽瓶颈型负载性能直接收益

主要竞品：AMD MI300X（192GB HBM3，显存更大但 ROCm 生态弱）、Google TPU v5p（内部使用）。

客户与部署

CoreWeave / Lambda Labs / Nebius：Neoclouds 2024 主力新增机型
Microsoft Azure / AWS / Oracle Cloud Infrastructure：2024 H2 上线 H200 实例
中国市场：H200 因更高带宽完全受出口管制，国内主要通过 H20（特供版）替代

演进路线

NVIDIA H100 → H200（显存升级）→ NVIDIA B200（新架构 Blackwell） → NVIDIA B300

关键来源

3-02-AI算力租赁-智算服务 —— 2024 算力租赁市场 H200 与 H100 价差约 30%
2-01-核心逻辑芯片 —— Hopper 系列产品矩阵分析

关联

↑ up::2-01-核心逻辑芯片 CoWoS HBM3E ↓ down::3-01-云计算与智算平台 3-02-AI算力租赁-智算服务 4-04-模型部署与优化 ⚔ competitor::AMD MI300X AMD MI325X ∈ belongs_to::2-01-核心逻辑芯片

反向引用链接到本页

反向引用 16

按引用量 ↓

… > [[AMD]] Instinct 系列 2024 年款数据中心 GPU（2024-10 发布），是 [[AMD MI300X]] 的显存升级版（HBM3 → [[HBM3E]] 256GB），对标 NVIDIA H200。 ## 关键规格 | 维度 | 数值 | |---|---| | 架构 | CDNA 3（与 MI300X 同代） | | 发布 | 2024-10 | …

… MI325X = 升级显存的 MI300X： - 显存 192GB HBM3 → **256GB HBM3E**（容量 +33%、带宽 +13%） - 算力与 MI300X 基本一致 - 对标 NVIDIA H200（141GB），显存优势进一步拉大 - 但 [[NVIDIA B200]] 同期上市（192GB HBM3E，更高算力），MI325X 价值定位被压缩 ## 客户与部署 …

… ↑ up::[[2-01-核心逻辑芯片]] [[CoWoS]] [[HBM3E]] [[ROCm]] ↓ down::[[3-01-云计算与智算平台]] [[3-02-AI算力租赁-智算服务]] ⚔ competitor::NVIDIA H200 [[NVIDIA B100]] ∈ belongs_to::[[2-01-核心逻辑芯片]] …

查看原文 →

… | [[Microsoft]] 占 2024 营收比例 | **62%**（最大单一客户） | 2024 | | [[NVIDIA]] GPU 部署规模 | 25 万+ 颗（[[H100]]/H200/[[B200]]/[[GB200]]） | 2025 | | 数据中心数量 | 32 个（美国 + 欧洲） | 2025 | ## 核心产品 - **CoreWeave Cloud Platform** — 专为 AI/ML 优化的裸 …

… - **CoreWeave Cloud Platform** — 专为 AI/ML 优化的裸金属 GPU 云 - **Bare Metal GPU 实例** — [[H100]] / H200 / [[B200]] / [[GB200 NVL72]] 大规模部署 - **NVIDIA Mission Control** — 与 [[NVIDIA]] 联合打造的集群管理软件 …

… CoreWeave 在中国市场无业务，但其商业模式被 [[商汤科技]]、[[燧原科技]]、[[摩尔线程]] 等中国 AI 算力公司部分对标。 ## 客户与供应链 ↑ up::[[NVIDIA]] [[H100]] H200 [[B200]] [[GB200 NVL72]] [[InfiniBand]] 美国二线 IDC ↓ down::[[Microsoft]]（OpenAI 训练溢出） [[OpenAI]] [[Meta]] [[xAI]] [[Coher …

查看原文 →

… | 2024 年收入（估算） | $5-7 亿 | 2024 | | 客户结构 | AI 研究团队 + 大学/实验室 + 部分企业 | 2025 | | 主力 GPU | [[H100]] / H200 / [[B200]] / [[GB200 NVL72]] | 2025 | | 工作站业务（前期主力） | Lambda Vector / Lambda Hyperplane | 长期 | …

… | [[NVIDIA]] DGX-ready 数据中心认证 | 是 | 长期 | ## 核心产品 - **Lambda GPU Cloud（on-demand）** — 按小时计费 GPU 实例（[[H100]] / H200 / [[B200]]），秒级启动 - **Lambda 1-Click Clusters** — 32-512 颗 [[H100]] / [[GB200]] 整集群按周/月租赁 …

… 但其"研究者 GPU 云"模式与中国部分智算平台（[[商汤科技]] [[SenseCore大装置]] / [[百度]] 的飞桨星河社区算力等）有理念相通之处。 ## 客户与供应链 ↑ up::[[NVIDIA]] [[H100]] H200 [[B200]] [[GB200 NVL72]] [[InfiniBand]] 美国 IDC ↓ down::Stanford / MIT 等大学实验室 OpenAI 研究人员（个人）独立 AI 研究者中小型 AI 初创公司 …

查看原文 →

… | 与 [[NVIDIA]] 联合参考架构 | NVIDIA DGX Cloud Lepton 合作伙伴 | 2025 | ## 核心产品 - **Nebius AI Cloud** — 主力 GPU 云平台，[[H100]] / H200 / [[B200]] / [[GB200 NVL72]] 实例 - **Nebius Studio** — 大模型推理 API 平台（类似 [[Bedrock]] / [[Vertex AI]]） …

… **完整 AI 全栈** — 不仅做 GPU 云，还有数据标注（Toloka）、自动驾驶（Avride）、教育（TripleTen）资产 5. **激进 capex 扩张** — 2025 资本开支指引 $20 亿+，部署 3.5 万颗 H200 / [[B200]] ## AI 时代角色 Nebius 是 AI 原生云（Neoclouds）赛道的**"欧洲 [[CoreWeave]]"**——同样深度绑定 [[NVIDIA]]、同样只做 GPU 算力不做通用云、同样定位高速增 …

… s 同时保留了 Yandex 的技术基因（[[Toloka]] 数据标注、[[Avride]] 自动驾驶）和欧美资本的接纳。在中国市场，Nebius 无业务。 ## 客户与供应链 ↑ up::[[NVIDIA]] [[H100]] H200 [[B200]] [[GB200 NVL72]] [[InfiniBand]] 欧洲 IDC（芬兰水电资源丰富） ↓ down::欧洲 AI 初创公司 [[Mistral]] Black Forest Labs Wayve 中东主权 AI …

查看原文 →

… | 互联 | [[Infinity Fabric]]（896 GB/s 8 卡互联） | ## 市场定位 MI300X 主打"**显存大 + 性价比**"差异化路线，对标 [[NVIDIA H100]] / NVIDIA H200： - 192GB HBM3 → 单卡可装更大模型（70B/175B 不切分），推理优势明显 - 价格估计约 H100 的 60-70% - **核心瓶颈** —— [[ROCm]] 生态远不及 CUDA 成熟，框架支持 / 性能调优需大量 …

… ↓ down::[[3-01-云计算与智算平台]] [[3-02-AI算力租赁-智算服务]] [[4-04-模型部署与优化]] ⚔ competitor::[[NVIDIA H100]] NVIDIA H200∈ belongs_to::[[2-01-核心逻辑芯片]] …

查看原文 →

… | AOS 主要产品 | 90A 级别 SPS（Smart Power Stage） | ## 事件经过 1. **背景** — 2023-2024 [[NVIDIA]] [[H100]] / H200 / [[B200]] 时代，DrMOS 由 [[Infineon]] / [[MPS]] / [[Renesas]] 主导，Infineon 份额 30%+，BOM 价格居高不下 …

查看原文 →

… 中国 [[阿里云]] [[腾讯云]] [[百度智能云]] [[火山引擎]] 的高端 AI 训练集群同样长期依赖 CUDA + [[NVIDIA]] [[H100]]/H200/[[B200]]。即便国产替代加速，[[CUDA生态]] 仍是云厂商招揽大模型客户的硬通货。 ## 关键来源 - [[2-01-核心逻辑芯片]] - [[3-01-云计算与智算平台]] …

查看原文 →